在分析不同类型体育赛事报道特点的基础上, 首次提出一种以实时数据作为数据源的足球赛事战报自动写作方法。该方法利用历史战报, 对实时数据进行自动标注, 得到训练集, 使用卷积神经网络(CNN)对标注后的实时数据进行建模, 自动识别实时数据中的关键事件, 将关键事件中结构化的信息生成战报风格的自然语言。实验表明, 与其他方法相比, 该方法写作效果更好, 内容更加详实, 可以很方便地扩展到其他赛事的自动写作。
基于 NBA 赛事新闻和文字直播的特点, 提出一种 NBA 赛事新闻自动写作方法。首先根据两支球队的比分差, 构建比分差函数, 并提出基于比分差函数性质的数据分片算法和数据合成算法; 然后对数据片进行分类处理, 根据数据片的类别以及历史 NBA 赛事的新闻报道, 构建 NBA 赛事报道模板库, 并以球队和球员的表现为中心, 将数据片的信息填入已构建好的模板, 得到一篇自动生成的 NBA 赛事新闻稿。提出 4 种指标衡量 NBA 赛事新闻自动写作的质量。实验表明, 该方法有效、可行, 并且写作速度较快, 能够对赛事新闻撰写者提供帮助。
提出一种自动分析汉语小句级句际关系树的新方法。在修辞结构理论体系下, 构建一个汉语句际关系标注语料库。不同于传统的只关心相邻两个单元的方法, 提出一种类排序模型(SVM-R), 自动构建汉语句际关系的树结构, 旨在把握相邻3 个单元之间的关联强度。实验结果表明, 所提出的SVM-R模型对句际关系树的分析显著优于传统方法。最后提出并验证了丰富的、适合于汉语句际关系分析的语言特征。